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PRESENTACIÓN 



Con este volumen, el Instituto Nacional para 
la Evaluación de la Educación (INEE) inicia 
una nueva serie de publicaciones, que difundirá 
textos relevantes sobre la evaluación educativa 
creados por la pluma de autores externos al Ins- 
tituto, o que no caben dentro de las otras se- 
ries que comprende su programa editorial. En el 
caso de obras de autores externos, además de su 
interés, se considerará la dificultad de acceder 
a ellas por los lectores mexicanos, debido a no 
estar publicadas en español u otras razones. Este 
fue el caso de la obra Learning divides, del inves- 
tigador canadiense Jon Douglas Willms, que el 
INEE hizo traducir y publicó con el debido per- 
miso del editor original, el Instituto de Estadís- 
ticas de la UNESCO, con el título Las brechas de 
aprendizaje. 

La obra que se difunde ahora, de la profesora 
Lorrie A. Shepard, de la Universidad de Colora- 
do en Boulder, es un texto fundamental sobre 
un tema que el INEE considera de gran interés 
para toda persona interesada en la evaluación, 
especialmente para los que en el momento ac- 
tual sienten preocupación por el enfoque que 
se está dando a la evaluación en gran escala en 
nuestro país. 

Convencido como lo está del potencial po- 
sitivo de la evaluación en gran escala, el INEE 
comparte la preocupación de no pocas perso- 
nas del medio educativo, en el sentido de que 
ciertos usos de ese tipo de evaluaciones pueden 
tener también serias consecuencias negativas. 
Por ello, es de gran importancia reflexionar se- 
riamente sobre los alcances y limitaciones de di- 
chas evaluaciones, así como sobre la necesidad 
de que se fortalezcan paralelamente las evalua- 



ciones a cargo de los maestros, de manera que la 
combinación de unas y otras contribuya verda- 
deramente a avanzar en la dirección que a todos 
nos interesa: la de la mejora real y profunda de 
la educación que nuestras escuelas ofrecen a los 
niños y niñas de México. 

La obra que se presenta es un texto de pri- 
mera importancia en relación con estos temas, y 
por ello el INEE la pone al alcance de los maes- 
tros de nuestro sistema educativo, y de todas 
las personas interesadas por la calidad educati- 
va. En los párrafos siguientes se desarrollan con 
mayor amplitud las preocupaciones que nos han 
llevado a difundirla. 

En su forma más conocida, la evaluación edu- 
cativa no es algo reciente. La tarea del maestro, 
en su interacción cotidiana con los alumnos, ha 
incluido siempre, como una dimensión funda- 
mental, el evaluar los avances de cada uno. En 
las formas tradicionales de enseñanza que preva- 
lecieron hasta bien entrado el siglo XIX, cuando 
surgieron los sistemas educativos de concepción 
moderna con los que estamos familiarizados 
-con cobertura que tendía a ser universal y, 
por ello, con muchos alumnos, organizados en 
grados de edad y avance similar- la tarea de los 
maestros era más de evaluación que de docencia. 
En las escuelitas en que un dómine atendía a una 
docena de chicos de distintas edades y niveles, 
para enseñarles a leer, escribir, contar y rezar, la 
lección magistral estaba ausente; el trabajo del 
maestro se limitaba fundamentalmente a tomar 
la lección a cada alumno, indicándole, en función 
de su avance, la siguiente tarea. 

La que sí es bastante reciente es la evalua- 
ción en gran escala, la aplicación estandarizada de 
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pruebas a grandes números de alumnos, para 
apreciar el nivel de aprendizaje que se alcanza 
en el sistema educativo de todo un país, región 
o distrito, ante la imposibilidad de agregar las 
evaluaciones que hacen los maestros, siempre 
ligadas al contexto en que trabaja cada uno. 

Con antecedentes que se remontan al final 
del siglo XIX, las evaluaciones en gran escala se 
desarrollaron en los Estados Unidos, durante la 
primera mitad del siglo XX, adquirieron impon 
tancia a lo largo de su segunda mitad y se exten- 
dieron a la mayor parte de los países del mundo 
en las dos o tres últimas décadas. Además de 
evaluaciones nacionales, se desarrollaron pro- 
yectos internacionales que hoy atraen poderosa- 
mente la atención cada vez que se difunden sus 
resultados. Las más conocidas son las pruebas 
del Proyecto para la Evaluación Internacional de 
los Estudiantes (PISA, por sus siglas en inglés), 
de la Organización para la Cooperación y el De- 
sarrollo Económicos (OCDE), cuyo desarrollo 
comenzó a planearse en 1995, y se aplican cada 
tres años desde el 2000. 

Más de tres décadas antes, en 1958, comen- 
zaba a gestarse la Asociación Internacional de 
Evaluación del Rendimiento Académico (IEA, 
por sus siglas en inglés), con la planeación del 
Primer Estudio Internacional sobre Matemá- 
ticas que se llevó a cabo en la década de 1960, 
del que se deriva el Estudio de Tendencias en 
Matemáticas y Ciencias (TIMSS) una de las eva- 
luaciones vigentes más importantes. En México, 
el desarrollo de pruebas en gran escala para edu- 
cación básica dio inicio desde la década de 1970, 
y se desarrolló sobre todo a partir de la de 1990, 
con las pruebas para evaluar el Factor Aprove- 
chamiento Escolar del Programa de Carrera Ma- 
gisterial. La tendencia se acentuó en la última 
década, con las pruebas del Instituto Nacional 
para la Evaluación de la Educación (INEE), a 
partir de 2003, y las pruebas censales de la Se- 
cretaría de Educación Pública, desde 2006. 

Las pruebas en gran escala pueden ser una 
herramienta valiosa para apoyar los esfuerzos 
de mejora de la calidad educativa, si se las ve 
como un complemento de las evaluaciones a 



cargo de los maestros, insustituibles para eva- 
luar de manera detallada todos los aspectos 
del currículo y para hacerlo de manera que 
puedan ofrecer a cada alumno la retroalimen- 
tación precisa sobre sus puntos fuertes y dé- 
biles, esencial para mejorar el aprendizaje. Es 
preciso, sin embargo, advertir sobre un riesgo 
que no se puede ignorar: el peligro de que las 
pruebas en gran escala produzcan consecuen- 
cias negativas para la calidad educativa, si se 
les comprende y utiliza mal. 

En efecto: para poder dar resultados con- 
fiables de los niveles de aprendizaje que al- 
canzan muchos miles de alumnos, una prueba 
estandarizada necesariamente tiene que redu- 
cirse a la medición de un número relativamen- 
te mínimo de temas, y debe hacerlo mediante 
preguntas que no pueden atender los aspec- 
tos más complejos de las competencias que 
pretende desarrollar la escuela. Por ello, hay 
que reiterar que las pruebas en gran escala no 
pueden sustituir el trabajo de evaluación de 
los maestros, el único que puede atender con 
precisión los aspectos más complejos de la en- 
señanza y el aprendizaje, y hacerlo de modo 
que se brinde retroalimentación detallada y 
oportuna a cada alumno. 

Si no se entienden bien los alcances y límites 
de los resultados de las pruebas en gran escala, 
es fácil que se usen en forma inapropiada. El 
peligro más claro es la tendencia a tomar como 
referente para la tarea docente el contenido de 
las pruebas y no el de los programas de estudio, 
enseñando para las pruebas, por la visibilidad de 
sus resultados. Con ello la tarea de la escuela se 
empobrece, al descuidar aspectos esenciales que 
no evalúan las pruebas en gran escala, como la 
expresión escrita y oral, la formación de acti- 
tudes y valores, la educación artística, e incluso 
los niveles cognitivos más complejos de las áreas 
tradicionalmente cubiertas de Lectura, Mate- 
máticas y Ciencias. 

Otros ejemplos de manejo inapropiado de los 
resultados de las evaluaciones en gran escala son 
la asignación de estímulos a los docentes o la ela- 
boración de ordenamientos simples de escuelas, 
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supuestamente en función de la calidad de unos 
y otras, sin tener en cuenta los numerosos facto- 
res que inciden en los resultados de los alumnos 
en las pruebas ni tener en cuenta las limitacio- 
nes de éstas. Este tipo de errores, además, pro- 
duce un explicable rechazo de toda evaluación 
en gran escala por parte de muchos maestros, 
que perciben sus graves consecuencias para la 
educación. Por ello, conviene reiterar que la 
evaluación en gran escala puede ser muy valio- 
sa para la mejora de la calidad, a condición de 
entenderla y usarla viéndola como complemento 
del trabajo del maestro, y no como sustituto del 
mismo. Para eso es necesario que los maestros 
entiendan bien los alcances y límites de la eva- 
luación en gran escala, y los de la evaluación que 
ellos llevan cabo. 

En México la formación inicial que reciben 
muchos maestros no los prepara bien ni para 
una cosa ni para la otra. Un indicio de ello es la 
solicitud que el INEE suele recibir, de maestros, 
supervisores y directivos de escuelas normales, 
para impartir talleres de elaboración de reacti- 
vos de opción múltiple, gracias a lo cual se espe- 
ra que mejore la calidad de las evaluaciones que 
deben hacer los maestros. En el Instituto hemos 
mantenido la posición anterior sobre los alcan- 
ces y límites de la evaluación en gran escala, y 
sobre la necesidad de verla como complemen- 
taria de la evaluación a cargo de los maestros, 
y nos enfrentamos permanentemente con una 
dificultad considerable para conseguir que esta 
postura sea comprendida no sólo por la socie- 
dad en general, sino también por las autoridades 
educativas y por los maestros, como muestran 
las demandas a las que alude el párrafo. 

Si se comprenden las características de las 
evaluaciones en gran escala y en aula, se enten- 



derá también que las preguntas de opción múl- 
tiple son esenciales en las primeras, pero que 
las segundas, las evaluaciones que los maestros 
llevan a cabo, pueden utilizar acercamientos di- 
ferentes y mejores para evaluar aspectos finos 
y complejos, los cuales difícilmente se pueden 
atender en gran escala, pero que en el ámbito del 
aula es posible emplear. Las preguntas de opción 
múltiple pueden ser usadas también en el aula, 
y son adecuadas para evaluar algunos aspectos 
del aprendizaje, pero otros deben valorarse de 
formas distintas, como mediante la producción 
de textos amplios, la realización de ejercicios en 
vivo, la observación del trabajo individual y gru- 
pal de los alumnos, entre otros. 

La expresión evaluación en aula ( classroom as- 
sessment) se refiere a este tipo de acercamientos. 
Es importante que escuelas normales y progra- 
mas de actualización de maestros en servicio 
presten la atención que merecen a estos enfo- 
ques, relativamente recientes y poco conocidos 
en nuestro medio. 

Para contribuir al desarrollo de estas innova- 
doras ideas, el INEE hizo las gestiones necesa- 
rias para difundir en español el texto siguiente, 
de una de sus principales defensoras. Al invitar 
a leerlo y reflexionar detenidamente sobre su 
contenido, expreso el deseo de que la evaluación 
educativa en México se desarrolle combinando 
el avance técnico de las pruebas en gran escala, 
con un uso de sus resultados que no ignore sus 
límites y un avance substancial de la evaluación 
en aula, a cargo de los maestros. Así, y sólo así, la 
evaluación podrá contribuir realmente a la me- 
jora educativa. 

Felipe Martínez Rizo 

Julio de 2008. 
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El modelo de evaluación en el aula que se explica 
detalladamente en este trabajo es muy diferente 
del modelo de pruebas y mediciones que predo- 
minó en aulas y escuelas durante el siglo pasado. 
En los primeros años del siglo XX, los expertos 
en mediciones creían que podían usarse pruebas 
nuevas y objetivas para estudiar y mejorar los re- 
sultados de la educación, así como para encargan 
se del diagnóstico y la colocación de estudiantes 
de acuerdo con sus necesidades de aprendizaje 
(Symonds, 1927; Thorndike, 1913). El punto de 
vista prevaleciente fue que los expertos debían 
elaborar pruebas estandarizadas que los do- 
centes utilizarían con objeto de incrementar la 
precisión en su toma de decisiones. Además, los 
expertos en mediciones empezaron a enseñar a 
los maestros cómo hacer sus propias pruebas si- 
guiendo principios científicos de medición. En 
aquellos primeros años, se desarrolló un sistema 
para los libros de texto de mediciones con el fin 
de enseñar a los maestros cuestiones sobre la 
validez y la confiabilidad (utilizando representa- 
ciones en su mayor parte cuantitativas), la ela- 
boración de pruebas, los formatos y el análisis 
de reactivos, así como análisis estadísticos de los 
resultados de las pruebas. Este sistema — que 
consistía casi exclusivamente en pruebas forma- 
les, cuestionarios y calificaciones — ha seguido 
siendo el modelo de los libros de texto hasta el 
día de hoy 

En contraste con este modelo técnico y cuan- 
titativo, existe un punto de vista diferente de la 
evaluación en el aula, que se desarrolló a fines 
del siglo XX y que busca lograr que, en mucho 
mayor medida, el estudiante alcance un entendi- 
miento; asimismo, busca obtener el uso forma- 



tivo de la evaluación como parte del proceso de 
aprendizaje (Black, y Wiliam, 1998; Gipps, 1999; 
Shepard, 2000). A principios de la década de los 
ochenta, el interés en reformar la práctica de la 
evaluación se vio acuciado por un uso mayor de 
pruebas estandarizadas, cuyo propósito era la 
responsabilización*, y por una evidencia cada vez 
mayor de que los formatos estrechos de pruebas 
tenían un efecto perjudicial en la calidad de la 
enseñanza y el aprendizaje de los estudiantes 
(Resnick y Resnick, 1992; U.S. Congress, Office of 
Technology Assessment, 1992). Adelantándose a los 
expertos en mediciones, los especialistas en las 
materias empezaron a desarrollar estrategias de 
evaluación que se vinculaban más estrechamente 
a los objetivos curriculares (Kulm, 1990; Mathe- 
matical Sciences Education Boarad, 1993; Morrow 
y Smith, 1990; Valencia y Calfee, 1991). Por otra 
parte, la investigación en psicología cognitiva 
y motivacional aportó tanto la teoría como las 
evidencias, gracias a las cuales se perfiló el cami- 
no para los cambios que se necesitaban (Black, 
y Wiliam, 1998; Crooks, 1988; Pellegrino, Chu- 
dowsky y Glaser, 2001). Por último, este nuevo 
modelo de evaluación en el aula, se ha hecho 
manifiesto en un nuevo tipo de libro de texto de 



' El concepto del que habla la autora es accountability , que se ha tra- 
ducido como responsabilización porque se responsabiliza a escuelas, 
directores y maestros del progreso académico de los estudiantes. 
Este concepto, en el contexto de la educación, hace referencia al 
uso sistemático de datos de evaluación y otro tipo de informa- 
ción para garantizar que las escuelas vayan en la dirección deseada. 
Con frecuencia, en los sistemas de responsabilización se incluyen 
metas, indicadores de progreso hacia el cumplimiento de esas me- 
tas y análisis de datos, así como procedimientos de información 
prescritos y consecuencias o sanciones. La responsabilización a 
menudo incluye el uso de resultados de evaluación y otros datos 
para determinar la eficacia del programa y para tomar decisiones 
sobre recursos, recompensas y consecuencias. (Nota de la traduc- 
toraXN. T.} 
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evaluación fundamentado en la práctica docente 
(Stiggins, 2001; Taylor y Nolen, 2005). Al señalar 
la naturaleza fundamental de esta transforma- 
ción, unos cuantos expertos en mediciones han 
empezado a preguntar cómo deberían cambiar 
las ideas tradicionales de vaHdez y confiabilidad 
en el contexto del aula (Brookhart, 2003; Mac- 
millan, 2003; Moss, 2003; Smith, 2003). 

En este capítulo se presenta, tanto la concep- 
ción como los fundamentos de la investigación 
sobre las estrategias de evaluación en el aula 
concebidas para ser parte integral de la enseñan- 
za y el aprendizaje. Comienza con una introduc- 
ción histórica para expHcar el punto de vista que 
sostuvieron ciertos teóricos de la medición en el 
pasado sobre la aplicación de pruebas en el aula. 
Se detiene específicamente en los puntos de vis- 
ta presentados en ediciones previas de Educatio- 
nal Measurement, obras editadas por Lindquist 
(1951), Thorndike (1971) y Linn (1989), respec- 
tivamente. La intención es identificar las ideas 
que han perdurado, así como las que actualmen- 
te se impugnan. La parte principal del capítulo 
está organizada en tres secciones: 1) Evaluación 
formativa, 2) Evaluación sumativa y calificación, 
3) Evaluaciones externas y en gran escala. En una 
sección de conclusiones, se consideran las impli- 
caciones de estas ideas transformadoras para el 
campo de la medición educativa. Se propone un 
programa de investigación y se sugieren los cam- 
bios que se necesitan en la conceptualización de 
la validez y la confiabilidad para los objetivos del 
aula. 

1. PANORAMA HISTÓRICO 
DE LA MEDICIÓN EDUCATIVA 
Y LAS AULAS 

El movimiento que pugnaba para que se apli- 
caran pruebas de rendimiento escolar — que se 
inició en 1908 con la publicación por Thorn- 
dike y sus alumnos de pruebas de Aritmética y 
Escritura — estaba estrechamente relacionado 
con el movimiento de la administración cien- 
tífica o movimiento de la eficiencia social. Sus 
líderes, que consideraban que las escuelas esta- 



ban fallando (U. S. Congress, Office of Technology 
Assessment, 1992), elaboraron instrumentos para 
documentar la necesidad de mejorarlas y esta- 
blecer el rumbo para lograrlo. Se pedían pruebas 
estandarizadas para que pudieran agregarse re- 
sultados de diversas escuelas y compararlas en- 
tre sí; y el nuevo tipo de examen objetivo se con- 
sideró como un remedio para la escandalosa falta 
de confiabilidad de los exámenes que hacían los 
maestros, y que había quedado demostrada en 
varios estudios anteriores (Thorndike, 1922). 
Desde el principio hubo también críticos que 
se quejaron de que las pruebas objetivas medían 
tan sólo hechos o fragmentos de información en vez de 
que midieran la capacidad de razonar y la aptitud 
para la organización, etcétera, (Wood, 1923). No 
obstante, al hablar en nombre del pensamiento 
dominante, Wood estableció los argumentos 
fundamentales de las ventajas de la medición 
objetiva 1 , los cuales fueron repetidos a lo largo 
de todo el siglo: 

La prueba estandarizada es sumamente 
exacta no sólo debido a que uno puede ca- 
lificarla objetivamente, sino porque da su- 
ficientes muestras del desempeño del exa- 
minado así como del material sobre el cual 
se examina. Por otra parte, es lo bastante 
flexible como para que pueda examinar no 
sólo información sino también juicio, y la 
evaluación de relaciones, causas y conse- 
cuencias. (p. 162) 

No hay tanta oposición entre información 
y razonamiento como algunos maestros 
quisieran hacernos creer ... Los hechos no 
son sólo un aspecto legítimo e indudable 
del pensamiento... sino que sólo el pensa- 
miento puede adquirirlos, conservarlos y 
reproducirlos, y sólo puede hacerse esto 
mediante la organización lógica y sistemá- 
tica del material, (p. 162) 

Todo estudio experimental del que tenga- 



1 Para ser justos, Wood (1923) argumentó en favor del uso de prue- 
bas estandarizadas por su mayor confiabilidad con el fin de com- 
plementar mediciones que utilizaban los exámenes tradicionales 
de ensayo. Sin embargo, otros usaron posteriormente este mismo 
razonamiento para sustituir pruebas de ensayo por pruebas obje- 
tivas más confiables. 
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mos conocimiento, y que se haya realizado 
hasta ahora, ha mostrado una fuerte rela- 
ción entre la medición de la información 
en un campo y la inteligencia o la capaci- 
dad de pensar en el material de ese campo, 
(p. 163) 

Por otra parte, puesto que las pruebas de ren- 
dimiento se elaboraron en el mismo periodo y 
las hicieron los mismos autores de las pruebas 
de Coeficiente Intelectual (CI), ambos tipos de 
pruebas llegaron a tener los mismos formatos 
de reactivos y los mismos modelos estadísticos 
cuyas raíces se hundían en la psicología de las 
diferencias individuales. 

Después de la Primera Guerra Mundial, el 
uso de pruebas estandarizadas de rendimiento 
aumentó notablemente debido al éxito práctico 
y en gran escala de la prueba Army Alpha, al esta- 
blecimiento de grandes oficinas de investigación 
educativa y agencias de investigación coopera- 
tiva, y a la conceptualización de Ralph Tyler en 
el campo de la evaluación educativa, con el pro- 
pósito de evaluar cuán bien habían logrado sus 
objetivos los programas educativos (Cook, 1941; 
Madaus y Stufílebeam, 2000; U. S. Congress, 
Office of Technology Assessment, 1992). 

La primera edición de Educational Measure- 
ment, libro que se publicó en 1951 y que editó 
E. F. Lindquist, reflejó y extendió la idea de que 
las pruebas estandarizadas eran esenciales para 
el proceso de evaluación y mejoramiento de la 
educación. Si bien los autores de los capítulos 
de la edición de 1951 dicen que las “funciones 
de la medición educativa se relacionan... con 
la facilitación del aprendizaje” (Cook, 1951, p. 
4), lo que ellos tenían en mente era que esto lo 
realizarían pruebas elaboradas fuera del aula. Su 
punto de vista era que había que desarrollar pro- 
gramas de pruebas estandarizadas en los distri- 
tos escolares, que es lo que hoy podría llamarse 
administración de datos o sistemas manejados 
con datos. La distinción que se hace en nuestro 
informe contemporáneo Knowing What Students 
Know (Pellegrino et al., 2001) — entre los tipos 
de datos de evaluación que se necesitan para 
las políticas en gran escala, en contraposición 



con las decisiones rutinarias que se toman en el 
aula — no era una distinción evidente en 1951. 

Walter Cook (1951), en su capítulo titulado 
The Functions of Measurement in the Facilitation of 
Fearning, defendía el uso de la medición objetiva 
para adaptar la enseñanza a las necesidades indi- 
viduales de aprendizaje. En tanto que reconocía 
que “Los mejores maestros no dejan de seguir 
constantemente el proceso de verificación del 
aprendizaje mediante la observación directa de 
la conducta y las pruebas informales”, al mismo 
tiempo argumentaba en favor del valor de las 
pruebas preparadas por expertos porque: 

1. Son más concienzudamente anabticas que 
la mayoría de las que podrían preparar los 
maestros. 

2. Elacen que los maestros tomen concien- 
cia de los elementos importantes, las se- 
cuencias necesarias y las dificultades del 
proceso. 

3. Ahorran tiempo y energía al maestro 
para hacer diagnósticos, y le dejan más 
tiempo y energía para que haga el trabajo 
de corrección. 

4. Ayudan al alumno a reconocer sus necesi- 
dades de aprendizaje al hacer hincapié en 
forma sistemática en sus errores. 

5. Los procedimientos correctivos se indi- 
can o proporcionan al maestro y le aho- 
rran tiempo, así como también le ayudan 
a sistematizar el proceso, (p. 37) 

En el capítulo sobre The Functions of Measurement 
in Improving Instruction, que se relaciona con lo 
anterior, Tyler (1951) observó que “la medición 
educativa está concebida, no como un proceso 
totalmente distinto de la enseñanza, sino más 
bien como una parte integral de ésta” (p. 47). 
Pese a la similitud entre estas palabras y las con- 
cepciones actuales de la evaluación en el aula, los 
procesos que Tyler tenía en mente se asumían casi 
totalmente fuera del aula. Si bien algunos de los 
ejemplos de Tyler tomaban en cuenta la posibili- 
dad de que un instructor individual de un curso 
pudiera recorrer todo el proceso de planeación 
de la enseñanza — especificando objetivos, pla- 
nificando experiencias de aprendizaje y valoran- 
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do efectos — , Tyler se interesaba sobre todo en 
que un programa de pruebas de rendimiento en 
un distrito escolar se “planificara y desarrollara 
como parte integral del programa del currículo y 
la enseñanza” (p. 64). Los maestros aprenderían 
participando en el desarrollo de objetivos y en la 
elaboración de pruebas, y también aprenderían 
de los datos resultantes. 

Para la segunda edición, de 1971, Robert Gla- 
ser, un psicólogo cognitivo, y Anthony Nitro, un 
teórico de la medición, escribieron el capítulo 
sobre Measurement in Learning and Instruction. Su 
perspectiva formal de planificación de la ense- 
ñanza estaba influida por supuestos docentes 
conductistas y de la educación adaptativa por 
computadora, que gozaban de popularidad en 
la época. Al igual que Tyler y Cook, su visión 
planteaba la necesidad de pruebas pertinentes 
para la enseñanza, que se elaborarían fuera del 
aula y se entregarían a los docentes. ‘A medida 
que se desarrolla la enseñanza, la información 
para tomar decisiones educativas deben darse al 
docente, al estudiante y posiblemente a una má- 
quina” (pp. 626-627). Envista de la complejidad 
que implica el diseño de pruebas apropiadas, in- 
cluyendo la validación de modelos cuantitativos 
de adaptación de la enseñanza, “parecería ade- 
más que el agobio de planificar y elaborar tales 
pruebas, de procesar las respuestas y de llevar a 
cabo análisis preliminares de los resultados de 
la prueba, debe manejarlo alguien que no sea el 
maestro de la clase.” De nueva cuenta, al igual 
que Tyler, Glaser y Nitko vieron que estos resul- 
tados de las pruebas podrían estar al servicio de 
la evaluación de programas, al proporcionar una 
retroalimentación formativa a los responsables 
del sistema. Sin embargo, a diferencia de Tyler, 
estaban más interesados en datos de las prue- 
bas que pudieran usarse en forma permanente 
para adaptar la enseñanza a los estudiantes in- 
dividuales, y creían que su sistema de pruebas 
diseñado externamente podría quedar inclui- 
do en la enseñanza de un modo perfectamente 
consistente. “Si se hacen apropiadas y sutiles, la 
docencia, la educación y la aplicación de prue- 
bas se irán diluyendo una en otra”, (p. 646) 



Al escribir él solo para la tercera edición, Ni- 
tko (1989) ofreció nuevamente un enfoque sobre 
la planificación de la enseñanza que aprovechaba 
una base de investigación cognitiva sumamente 
sofisticada con el fin de ofrecer pruebas pertinen- 
tes, desde el punto de vista de la instrucción, para 
que se utilizaran en el aula. Revisó la literatura 
sobre pruebas de diagnóstico que se basaban en 
los conocimientos previos requeridos, en habi- 
lidades y en el dominio de objetivos conductua- 
les -acercamientos que reflejaban una idea muy 
estrecha de cómo se desarrolla el aprendizaje y 
una representación relativamente empobrecida 
del dominio de los contenidos. En contraste con 
esto, Nitko (1989) también estudió textos emer 
gentes de diagnóstico centrados en el análisis de 
errores y estructuras de conocimiento de los es- 
tudiantes. Estas últimas categorías le permitieron 
vislumbrar los temas de investigación que serían 
fundamentales para la concepción contemporá- 
nea del aprendizaje y la evaluación. Por ejemplo, 
“(la) comprensión que tenga quien diseña prue- 
bas sobre el significado y la estructura del cono- 
cimiento que un estudiante trae al sistema de 
enseñanza” podría utilizarse para identificar “la 
comprensión cotidiana de palabras y fenómenos 
{...} que no concuerden con la comprensión ca- 
nónica de los expertos” (p. 461). Es importante 
señalar que Nitko (1989) también observó que 
“la investigación reciente en psicología educativa 
indica que las formas en que los estudiantes re- 
presentan mentalmente el conocimiento son tan 
importantes, para el desarrollo de sus habilida- 
des para resolver problemas y para el aprendizaje 
avanzado, como las formas en que manifiestan su 
conocimiento conductualmente” (p.466). Si bien 
Nitko (1989) todavía imaginaba un sistema de en- 
señanza informal y de evaluación que se elabora- 
ría fuera del aula y se entregaría a los maestros, su 
punto de vista reflejó un cambio esencial e impon 
tante: quedaron lejos las pruebas de competencia 
del estudiante después de una lección o periodo 
de instrucción, donde pasaba o reprobaba, y se 
dio un paso hacia las evaluaciones más ricas de 
su comprensión y aprovechamiento en un campo 
del conocimiento. 
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Si bien los primeros volúmenes de Educa- 
tional Measurement tenían poco que decir sobre 
las pruebas que hacían los docentes o sobre las 
prácticas de evaluación en el aula, el movimien- 
to de pruebas estandarizadas y el paradigma de 
la evaluación de programas determinaron, no 
obstante, qué se enseñaba a los docentes acer- 
ca de la evaluación. Los teóricos de la medición, 
responsables de los cursos de Pruebas y Medicio- 
nes para maestros, creían que debía enseñarse 
a éstos cómo emular la confección de pruebas 
estandarizadas de rendimiento, así como de qué 
manera debían usar una diversidad de medicio- 
nes estandarizadas. Los libros de texto típicos 
desde la década de 1940 hasta la de 1990 incluían 
los siguientes capítulos: 

I . Finalidad de la medición y la evaluación 

II. Análisis estadístico de los resultados de 
pruebas 

ni. Validez 

IV Confiabilidad 

V. Principios generales de la elaboración 
de pruebas (incluye la especificación 
de los objetivos de la enseñanza) 

VI. Principios de la elaboración de pruebas 
objetivas 

VIL Principios de elaboración de pruebas de 
ensayo 

VIII. Análisis de reactivos para pruebas en 
el aula 

IX. Asignación de calificaciones y for- 
ma de reportarlas 

X. Pruebas de CI y aptitud académica 

XI. Pruebas estandarizadas de rendimiento 

XII. Mediciones de intereses y personalidad 

XIII. Interpretación de normas estadísticas 
para las pruebas 

Los libros de texto de medición se centraban 
en la elaboración de pruebas formales cuya fina- 
lidad era la asignación de calificaciones. Si bien 
varios autores mencionaban la importancia de 
utilizar la información que aportaban las pruebas 
para modificar la enseñanza, los libros de texto 
daban pocas explicaciones sobre el modo en que 
los docentes entenderían los datos con objeto de 
rediseñar su enseñanza. Algunos autores dieron 



por sentado que sería sencillo “volver a enseñar 
ciertas cuestiones” (Torgerson, y Adams, 1954). 
La estadística y las presentaciones cuantitativas 
de la confiabilidad y la validez fueron sobresa- 
lientes en cuanto a qué necesitaban saber los do- 
centes. En el prefacio a su texto de Educational 
Measurement , Travers (1955) señaló que muchos 
de sus colegas tenían preferencia por los libros 
de texto sobre medición psicológica porque brin- 
daban “un alimento intelectual más sólido que 
los libros sobre medición educativa ” (p. vi), en 
vista de lo cual aumentó el nivel técnico de su 
libro “para ayudar a fortalecer una debilidad en 
la preparación de los maestros” (p. vi). En una 
muestra de treinta libros de texto examinados 
para este análisis histórico, sólo encontré dos 
que tenían una sección o subsección dedicada 
al uso de la observación en el aula. Encontré un 
texto que menciona el uso de la evaluación para 
la retroalimentación 2 . La mayor parte de los tex- 
tos tenían un capítulo sobre la especificación 
de objetivos para la enseñanza; y, si se captara 
el mensaje principal de estos libros, ayudaría a 
los maestros a volverse más sistemáticos en el 
uso que hacen de diversos formatos de reacti- 
vos para representar un contenido importante. 
Sin embargo, sería justo decir que los aspectos 
técnicos de la elaboración de pruebas recibieron 
más atención que las conexiones entre la evalua- 
ción y las actividades de la enseñanza. 

El acento que ponen los integrantes de la 
comunidad de la medición en temas formales 
y técnicos también puede encontrarse en la li- 
teratura de investigación sobre la capacitación 
en medición para los maestros. Esta literatura, 
que se extiende por varias décadas, se lamenta 
constantemente de que los maestros han recibi- 
do una preparación deficiente para cumplir con 



J Brown (1981), de manera profética, comentó: “(El) aspecto efi- 
caz de la retroalimentación es saber si una pregunta se contestó 
correctamente o, si se contestó en forma incorrecta, saber dónde 
ocurrió el error y qué necesita hacerse para corregir dicho error. 
Esta información es suministrada por el señalamiento del maestro 
sobre la corrección de la respuesta y/o por sus comentarios, no 
por la calificación. Así, una prueba que se corrige, pero que no da 
lugar a una calificación, puede proporcionar tanta retroalimenta- 
ción útil a los estudiantes como una que si lleva a una calificación” 
(p. 171). 
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sus responsabilidades de medición y evaluación. 
Históricamente, muchos estudios dieron por 
sentado que los maestros necesitaban saber lo 
que se enseñaba en los cursos de Pruebas y Me- 
diciones, y hablaban de la idoneidad de dicha 
preparación según cuántos programas forma- 
tivos ofrecían tales cursos, cuántos estados los 
requerían y cuántos maestros los tomaban (Gos- 
lin, 1967; Noli, 1955; Roeder, 1972; Ward, 1980). 
Cuando los investigadores intentaron identifi- 
car en forma directa las habilidades específicas 
que se juzgaban esenciales para los maestros, los 
instrumentos que utilizaron en sus encuestas li- 
mitaron desafortunadamente la base de conoci- 
mientos posibles a los contenidos de los libros 
de medición. Así, por ejemplo, en el estudio de 
mayo de 1964, se pidió a maestros y directores 
así como a profesores de universidad y exper- 
tos en pruebas, que clasificaran la importancia 
de setenta competencias. Treinta y dos de éstas 
eran elementos estadísticos que tenían que ver 
con el cálculo y la interpretación de la media, 
la mediana y la moda, la desviación estándar, las 
puntuaciones estándar, las correlaciones y así 
sucesivamente. Las competencias restantes que 
recibieron clasificaciones más altas, correspon- 
dieron fielmente a los capítulos de los libros de 
texto de medición citados anteriormente. De 
igual manera, en 1973, Goehring utilizó libros de 
texto de Pruebas y Medición para generar una lista 
de 116 competencias y luego pidió a maestros y 
directores de escuelas que analizaran su impon 
tancia relativa. 

Sólo alguna que otra vez, y relativamente en 
fecha reciente, han empezado los especialistas 
de medición a fijarse en el contexto del aula para 
tratar de entender las necesidades que tienen 
los maestros de obtener competencia en eva- 
luación. En 1973 Fahr y Griffin cuestionaron la 
literatura que, al parecer, hacía de la medición 
un fin en sí mismo, y sostuvieron en cambio que 
las habilidades deben estar relacionadas direc- 
tamente con las decisiones de enseñanza que 
los maestros necesitan tomar. Varios estudios, 
centrados inicialmente en cómo se utilizaban 
en el aula las pruebas estandarizadas, revelaron 



la gran importancia de las pruebas elaboradas 
por los maestros, las pruebas incluidas en el cu- 
rrículo, y las interacciones y observaciones in- 
formales para su toma de decisiones cotidiana 
(DorrBremme, 1983; Salmon-Cox, 1981; Yeh, 
Hermán y Rudner, 1981). Gracias a datos de en- 
trevistas, DorrBremme (1983) concluyeron que 
los maestros actúan como razonadores prácticos 
y como clínicos, y que orientan sus actividades 
de evaluación a las tareas prácticas que deben 
de llevar a cabo en las rutinas cotidianas, tales 
como “decidir qué enseñar y cómo enseñarlo a 
los estudiantes de diferentes niveles de desem- 
peño; llevar el registro de cómo progresan los 
alumnos y cómo ellos (los maestros) pueden 
ajustar su enseñanza apropiadamente y evaluar 
y calificar a los estudiantes en su desempeño” 
(p. 3). Para estos fines, los maestros se apoyan 
en muy buena medida en las pruebas hechas por 
ellos y en las interacciones con los estudiantes y 
las observaciones que hacen de éstos. Stiggins 
y Conklin (1992) publicaron resultados de una 
serie de estudios de campo que documentaban 
qué hacen los maestros para evaluar a sus estu- 
diantes, y analizaron qué necesitarían saber los 
docentes para hacer bien estas tareas. Stiggins 
(1991) concluyó que la capacitación tradicional 
en medición ha estado crónicamente mal enfocada, 
tanto así, que sólo nosotros tenemos la culpa 
por la falta de atención dada a la capacitación 
en medición en los programas educativos para 
maestros. 

Muy aparte de la literatura sobre medición, 
los expertos en los contenidos de la enseñanza 
empezaron a elaborar alternativas a las pruebas 
estandarizadas para el aula, movidos por una 
aversión a los efectos de las pruebas de rendición 
de cuentas o responsabilización, pero también a 
causa de profundos cambios en las concepcio- 
nes del aprendizaje y el aprovechamiento en las 
materias (Shepard, 2000). En lectura, por ejem- 
plo, los investigadores que trabajaban desde una 
perspectiva emergente del alfabetismo (Clay, 
1985; Teale y Sulzby, 1986), se dedicaron mucho 
más a observar y respaldar las habilidades en de- 
sarrollo de niños en contextos sociales concre- 
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tos, más que en habilidades aisladas y descon- 
textualizadas. Clay (1985) inventó estrategias de 
evaluación insertas en el acto de leer, señalando 
que la investigación había fracasado en demos- 
trar que el aprendizaje hubiera mejorado por la 
asignación de estudiantes a grupos de diferente 
nivel con base en un diagnóstico asentado en 
pruebas de velocidad en lectura o en pruebas 
de prerrequisitos, tales como habilidad Hngüís- 
tica o discriminación visual. Goodman (1985) 
reintrodujo el concepto de vigilancia de los niños, 
un remanente del movimiento de estudios del 
niño, que estuvo en boga mucho tiempo antes. 
A diferencia de las pruebas estandarizadas que 
se aplican en un único momento, la vigilancia 
de niños es continua. Legitima la importancia 
de la observación profesional en el aula y tiene 
en cuenta experiencias de aprendizaje más ricas 
que aquellas que pueden sepultarse sin riesgos en 
la prueba (Goodman, 1985, p. 14). La reunión de 
muestras del trabajo de los estudiantes (Teale, 
Hiebert y Chittenden, 1987) se convirtió en un 
recurso valioso, no sólo para alcanzar una com- 
prensión del pensamiento de los niños, sino para 
documentar su progreso a lo largo del tiempo. 
Se descubrió que la narración de cuentos era 
más eficaz, tanto para los fines de la enseñanza 
como para los de evaluación, que las preguntas 
tradicionales de comprensión de lectura (Mo- 
rrow, 1985), y así sucesivamente. Irónicamente, 
estos investigadores estaban haciendo exacta- 
mente lo que Tyler había recomendado décadas 
antes al clarificar sus objetivos de enseñanza y 
buscar una representación lo más fiel posible de 
estos objetivos en sus planes de evaluación. Con 
todo, lo que Tyler no previo fueron las limitacio- 
nes de los formatos de las pruebas objetivas, que 
para finales del siglo XX ya no eran adecuadas 
para corresponder a las nuevas concepciones del 
aprendizaje de las materias (Shepard, 2000). 

En la comunidad de las Matemáticas, la fuer- 
za motriz y la dirección para los cambios en la 
evaluación fueron paralelos a los que hubo en 
Lectura. En el capítulo sobre Matemáticas del 
tercer Handbook of Research on Teaching, Romberg 
y Carpenter (1986) observaron que había ocurri- 



do un cambio considerable en la investigación 
sobre la enseñanza y el aprendizaje. Debido a 
la revolución de la ciencia cognitiva, la investi- 
gación ya no se centraba solamente en conduc- 
tas observables, sino que también tomaba en 
consideración procesos cognitivos internos. En 
vez de un modelo de aprendizaje en el que los 
maestros transmiten el conocimiento y los estu- 
diantes lo absorben, el nuevo modelo de apren- 
dizaje sostiene que los estudiantes construyen 
activamente conocimiento nuevo. En las obras 
del National Council of Teachers of Mathematics 
(Consejo Nacional de Maestros de Matemáticas 
{NCTM}, por sus siglas en inglés) Curriculum and 
Evaluation Standardsfor School Mathematics (1989) 
y Everybody Counts, un informe del National Re- 
search Council (1989), el aprendizaje de las Mate- 
máticas se redefinió, más bien, como un proceso 
de indagación y de búsqueda de sentido que una 
repetición y mímica sin sentido. Para la evaluación 
esto significaba que se necesitaban problemas 
más extensos y no rutinarios para atraer a los 
estudiantes y para evaluar la potencia matemática 
-definida como la capacidad de usar el conoci- 
miento matemático “para razonar y pensar crea- 
tivamente y para formular, resolver y reflexionar 
críticamente en los problemas” (NCTM, 1989, 
p. 205). Además, el discurso del aula se convirtió 
en un punto focal de las reformas en Matemáti- 
cas que buscaba proporcionar a los estudiantes 
la oportunidad de conjeturar y explicar su razo- 
namiento. Estas nuevas rutinas de enseñanza 
incrementaron al mismo tiempo la importancia 
de las evaluaciones informales e integradas -ob- 
servaciones, preguntas del maestro y escritura 
de un diario- como medios para comprender el 
pensamiento de los estudiantes (Silver y Kenney, 
1995). En vez de la práctica imperante según la 
cual los maestros ajustaban sus propias pruebas 
para que emularan tanto la forma como el conte- 
nido de las pruebas externas de opción múltiple, 
Silver y Kilpatrick (1989) sostuvieron que debía 
hacerse un esfuerzo serio para dotar de nuevas ha- 
bilidades a los docentes, para que pudieran dar 
clases con enfoque de resolución de problemas 
y para evaluar las capacidades y actitudes de sus 
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estudiantes en cuanto a resolución de proble- 
mas, en el contexto de tales clases. 

Pueden narrarse historias parecidas para otras 
materias, como ciencias y estudios sociales. En 
cada caso, los reformadores de finales del siglo 
XX estuvieron motivados por la teoría construc- 
tivista del aprendizaje y la necesidad de una ense- 
ñanza y una evaluación más auténticas (Resnick y 
Resnick, 1992; Wiggins, 1993). Para la comunidad 
dedicada a las mediciones en Estados Unidos, el 
impacto de estos cambios se concentró princi- 
palmente en reformar programas de evaluación 
en gran escala, ya que varios estados iniciaron un 
programa de evaluaciones innovadoras y basadas 
en el desempeño (Barón y Wolf, 1996). Quizá a 
causa de la gran importancia de las pruebas de 
responsabilización externa 3 , la comunidad estu- 
diosa de las mediciones mostró lentitud en consi- 
derar las implicaciones de estos cambios teóricos 
para la evaluación en el aula. Se formó un peque- 
ño Grupo de Interés Especial dentro de la American 
Educational Research Association ; pero, durante los 
años noventa, por ejemplo, la evaluación en el 
aula o temas afines, tales como las formas de asig- 
nar calificaciones, dieron cuenta de sólo el 4% de 
las sesiones en las reuniones anuales del National 
Council on Measurement in Education (Consejo Na- 
cional de la Medición en Educación). En Gran 
Bretaña, las pruebas estandarizadas tomaron una 
dirección muy diferente. El Assessment Reform 
Group (1999), que empezó en 1989 como un Gru- 
po de Tareas [Task Group } de la British Educational 
Research Association, se centró en el vínculo deci- 
sivo entre la evaluación en el aula y la enseñanza 
y el aprendizaje. El Assessment Reform Group acu- 
ñó la expresión evaluación para el aprendizaje para 
referirse a la evaluación que respalda el proceso 
de aprendizaje, lo que contrasta con la evaluación 
que sólo mide los resultados del aprendizaje. Si- 
guiendo a Sadler (1989), Black y Wiliam (1998) 
hicieron que este aprendizaje se centrara en la 
característica definitoria de la evaluación forma- 



3 External accountability . Hace referencia a que la sociedad respon- 
sabiliza y, también pide una rendición de cuentas a la institución, 
a los maestros y/o a los estudiantes mismos. La interna sería la 
propia de la institución, los maestros y/o los estudiantes [N. T.] 



tiva, diciendo que la evaluación es formativa “sólo 
cuando la comparación de los niveles reales y los 
de referencia producen información que luego se 
usa para modificar la laguna” (p. 53). 

En la siguiente sección sobre la evaluación 
formativa, me explayo sobre la idea del uso de 
la evaluación como parte del proceso de apren- 
dizaje. La evaluación formativa se define como 
la evaluación llevada a cabo durante el proceso 
de enseñanza con el fin de mejorar la enseñanza 
o el aprendizaje. La evaluación formativa pue- 
de implicar métodos informales, tales como 
la observación y las preguntas orales, o el uso 
formativo de medidas más formales como exá- 
menes tradicionales, portafolios y evaluaciones 
del desempeño. También me ocupo de proble- 
mas de coherencia y de cómo podríamos lograr 
que las estrategias de evaluación formativas y 
sumativas se respaldaran mutuamente. La dis- 
tinción entre la evaluación formativa y la suma- 
tiva es paralela al uso original que Michael Scri- 
ven (1967) dio a estos términos, en el contexto 
de la evaluación curricular y la evaluación de 
programas, para distinguir entre la evaluación 
realizada durante el proceso de desarrollo para 
dar información al proceso mismo, en contra- 
posición con la evaluación del producto final. 
La evaluación sumativa , que se considera en una 
sección posterior, se refiere a las evaluaciones 
realizadas al final de una unidad de enseñanza 
o curso de estudio, con el propósito de dar ca- 
lificaciones o de certificar el aprovechamiento 
del estudiante. Como veremos, el nuevo mode- 
lo de evaluación formativa aspira a hacer que la 
evaluación forme parte integral de la enseñan- 
za, tal como lo propusieron los primero teóri- 
cos de la medición. La diferencia importante 
es que las estrategias que se explican aquí están 
construidas sobre un modelo muy diferente de 
enseñanza y aprendizaje, y no dependen de ins- 
trumentos estandarizados que se hayan elabo- 
rado fuera del salón de clase. 
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2. EVALUACIÓN FORMATIVA 

Para que los docentes sean eficaces en reforzar 
el aprendizaje de los estudiantes, deben com- 
probar constantemente la comprensión que és- 
tos vayan logrando. Por otra parte, tienen que 
darles a conocer la importancia de que ellos mis- 
mos asuman la responsabilidad de reflexionar y 
supervisar su propio progreso en el aprendiza- 
je. Un análisis fundamental de Black y Wiliam 
(1998), que marcó un hito, descubrió que los es- 
fuerzos orientados a mejorar la evaluación fon 
mativa producían beneficios mayores a la mitad 
de una desviación estándar. En otras palabras, 
la evaluación formativa, eficazmente implemen- 
tada, puede hacer tanto o más para mejorar la 
realización y los logros que cualquiera de las 
intervenciones más poderosas de la enseñanza, 
como la enseñanza intensiva de Lectura, las cla- 
ses particulares y otras parecidas. 

En esta sección, comienzo con un resumen 
de las teorías contemporáneas del aprendizaje 
y luego presento un modelo de evaluación fon 
mativa del que muestro su compatibilidad tan- 
to con la teoría cognitiva como con la teoría 
sociocultural del aprendizaje. Luego considero 
varias estrategias y herramientas específicas que 
comprenden el modelo general que los docen- 
tes utilizan como parte de las rutinas cotidianas 
de enseñanza. Estos procesos recursivos de eva- 
luación son esenciales para una revisión y per- 
feccionamiento continuos de la enseñanza así 
como para mejorar también el aprendizaje del 
estudiante. 

No obstante, antes es necesario hacer una 
advertencia. Las prácticas ideales de evaluación 
que aquí se explican y que se basan en la inves- 
tigación, son consistentes con las prácticas de 
maestros particularmente competentes y exper- 
tos, pero no necesariamente reflejan prácticas de 
evaluación típicas. De hecho, la mayoría de los 
maestros en servicio tiene solo un conocimiento 
limitado de estrategias de evaluación formativa, 
y sigue pensando en la evaluación como un pro- 
ceso que sirve principalmente para calificar. Por 
consiguiente, la sección final sobre la investiga- 



ción futura debe considerar el aprendizaje y el 
desarrollo profesional de los maestros así como 
a la eficacia de herramientas específicas de eva- 
luación. 

2.1 Teoría del aprendizaje, y coherencia 
en el diseño de la evaluación 

La obra Knowing What Students Know (Pellegrino 
et al., 2001) fue el resultado de un comité del 
National Research Council, que se encargó de re- 
unir los avances hechos tanto en la ciencia cog- 
nitiva como en la medición. Una premisa central 
que sustenta las recomendaciones de Knowing 
What Students Know es que las observaciones e 
interpretaciones de la evaluación deben estar 
relacionadas con un modelo cognitivo bien es- 
tructurado de cómo aprende el estudiante en 
cierto campo. Este modelo fundamental debe 
reflejar una comprensión actualizada de cómo 
se desarrolla el aprendizaje en un campo, y no 
las “creencias tan restrictivas” (Pellegrino et al., 
2001, p. 54) en que se basan las evaluaciones del 
logro académico que más se utilizan. Un modelo 
de aprendizaje sirve “como un elemento unifica- 
dor, un núcleo que da cohesión al currículo, la en- 
señanza y la evaluación” (Pellegrino et al., 2001, 
p. 54). Por otra parte, los autores de Knowing 
What Students Know argumentan más adelante 
en favor de esta misma coherencia esencial entre 
las evaluaciones externas y las que se hacen en 
clase. Para trabajar conjuntamente y respaldar el 
aprendizaje del estudiante, las evaluaciones en 
ambos niveles de un sistema de evaluación de- 
ben apoyarse en modelos compatibles sobre el 
aprendizaje del estudiante, aun cuando los mo- 
delos referentes al aula pueden ser mucho más 
detallados. En este capítulo, utilizo el concepto 
de coherencia para hablar acerca de cómo puede 
hacerse que se respalden mutuamente la evalua- 
ción formativa y la sumativa dentro del aula. 

En el panorama histórico que esbocé en lí- 
neas anteriores, los cambios en la teoría del 
aprendizaje se mencionaron varias veces como la 
fuerza motriz de los cambios en la forma en que 
conceptualizaron la enseñanza y la evaluación 
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los expertos en las materias. Las concepciones 
contemporáneas del aprendizaje han transfon 
mado nuestra comprensión de cómo ocurre el 
aprendizaje, pero de manera más fundamental, 
han alterado nuestras concepciones de qué es el 
aprendizaje, qué significa ser competente en un 
campo y, por consiguiente, cómo buscaríamos 
evidencia de esa competencia. La revolución cog- 
nitiva fue una rebelión en contra de la psicología 
de las diferencias individuales y el conductismo, 
que se había interesado sobre todo en la adquisi- 
ción de competencias mediante el reforzamien- 
to de conductas observadas, en lugar de tratar de 
explicar los procesos mentales básicos. En cam- 
bio, de acuerdo con la teoría cognitiva, quienes 
aprenden construyen el conocimiento conec- 
tando nueva información a estructuras previas 
de conocimiento. Los esquemas mentales, en el 
cerebro o la mente, sirven para organizar el co- 
nocimiento para que cuando después se necesite 
lo recuperemos y utilicemos en situaciones pro- 
blemáticas; y los procesos ejecutivos, llamados 
metacognición, permitan monitorear y manejar 
su propia comprensión y aprendizaje a quienes 
aprenden. Los cognitivistas hacen hincapié en la 
comprensión conceptual y han demostrado que 
la transferencia, esto es el uso del conocimien- 
to en situaciones nuevas, se hace posible por la 
aprehensión de principios generalizados y el uso 
de esquemas gracias a los cuales se reconocen 
las similitudes en los distintos tipos de proble- 
mas. La perspectiva cognitiva predomina en el 
trabajo teórico y empírico presentado en dos 
publicaciones significativas del National Research 
Council, How People Learn (Bransford, Brown, y 
Cocking, 1999) y Knowing What Students Know, 
si bien ambas reconocen la influencia del con- 
texto social y la aplicabilidad de las perspectivas 
socioculturales o situacionales. 

Un modelo sociocultural del aprendizaje 
surge de un renovado interés en el trabajo de 
Vygotsky (1978) y otros psicólogos rusos. Se ocu- 
pan de la naturaleza social del aprendizaje y en 
la idea de que la competencia y la identidad de 
quienes aprenden se desarrollan por medio de 
una participación mediada socialmente, en una 



actividad práctica llena de significado. Un indi- 
viduo aprende a pensar y a razonar gracias a una 
gran diversidad de apoyos proporcionados por 
adultos y pares más conocedores e informados. 
Este modelo de aprendizaje queda excelente- 
mente caracterizado como un proceso de induc- 
ción, o como un modelo del aprendiz, median- 
te el cual se permite a los novatos participar y 
hacer contribuciones en un contexto de trabajo 
real, pero a los que se asignan tareas adaptadas 
a su nivel particular de competencia. El ejemplo 
paradigmático, desde luego, es la forma como 
se adquiere el lenguaje gracias a un proceso de 
práctica mediada socialmente (Bruner, 1985). 
En la teoría sociocultural es fundamental com- 
prender que los productos de la actividad (los 
resultados del aprendizaje) están integrados en 
las prácticas culturales del ambiente donde se 
desarrolla la actividad. De este modo, aprender 
a conocer es volverse un adepto que participa en 
las maneras de hablar, las representaciones del 
conocimiento y el uso de herramientas asocia- 
das con una comunidad de práctica específica. 

En otro lado he propuesto una concepción 
del aprendizaje social- comtructivhta', que reúne 
las teorías cognitiva y sociocultural (Shepard, 
2000). Si bien hay muchos puntos discutibles 
no resueltos entre estas dos perspectivas y en 
el interior de ellas, las considero compatibles. 
Vygotsky (1978, p. 57) sostenía que “todas las fun- 
ciones en el desarrollo cultural del niño aparecen 
dos veces: primero, en el nivel social, y luego en 
el nivel individual; primero entre la gente ( interp- 
sicológica ), y luego dentro del niño ( intrapsicológi - 
ca)T Siguiendo la dirección de Vygotsky, pues, 
podemos usar la investigación sociocultural para 
entender los procesos sociales que respaldan y 
definen el aprendizaje, y la teoría cognitiva, con 
el fin de entender los procesos mentales subse- 
cuentes y recurrentes del individuo. Obsérvese, 
sin embargo, que incluso el razonamiento y las 
reflexiones de una persona aparentemente pri- 

4 En este capítulo no defino ni uso el término social-constructi- 
vismo como la conjunción de las teorías cognitiva y sociocultural, 
porque algunos autores utilizan el social-constructivismo en forma 
más estrecha para referirse solamente a una variante de la teoría 
cognitiva. 
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vadas, están integradas socialmente, porque el 
individuo lleva consigo las formas de razonar, las 
expectativas, los criterios, etcétera, de su mun- 
do social. Más recientemente, en mi trabajo me 
he concentrado en la teoría sociocultural porque 
creo que es la teoría más completa. 

2.2 Un modelo de la evaluación 
formativa 

Sadler (1989) aportó el modelo más aceptado de 
la evaluación formativa. Este autor indicó que 
es insuficiente que los maestros simplemente 
den una retroalimentación respecto de si las res- 
puestas son correctas o incorrectas. En vez de 
ello, para facilitar el aprendizaje, es igualmente 
importante que la retroalimentación esté vin- 
culada explícitamente a criterios claros de des- 
empeño y que se proporcione a los estudiantes 
estrategias de mejoramiento. Este modelo de 
evaluación formativa fue explicado más amplia- 
mente en un reporte reciente de Atkin, Black, 
y Coffey (2001) sobre evaluación en ciencias en 
el aula. Estos autores construyen el proceso de 
evaluación del aprendizaje con estas preguntas 
clave: 

• ¿Adonde tratas de ir? 

• ¿Dónde estás ahora? 

• ¿Cómo puedes llegar ahí? 

Al responder la pregunta de evaluación (la No. 
2, ¿dónde estás ahora?) en relación con el obje- 
tivo de la enseñanza (pregunta No. 1) y dedicán- 
dose específicamente a lo que se necesita para 
alcanzar el objetivo (pregunta N0.3), el proceso 
de evaluación formativa respalda directamente 
el mejoramiento. 

Establecer objetivos claros para el aprendizaje 
por parte del estudiante implica mucho más que 
anunciar una finalidad de la enseñanza para que 
los estudiantes la contemplen. También requiere 
la elaboración de los criterios mediante los cua- 
les será juzgado el trabajo del estudiante. ¿Cómo 
sabrán el maestro y el estudiante que se ha enten- 
dido un concepto? ¿Cómo se evaluará la capaci- 



dad del estudiante para defender un argumento? 
Luego, la fase de evaluación debe ocurrir durante 
el proceso de aprendizaje, mientras el estudiante 
trabaja en tareas que ejemplifican directamente el 
objetivo del aprendizaje que se propone alcanzar. 
Esta evaluación, que se hace en medio del apren- 
dizaje, podría ocurrir por medio de preguntas al 
estudiante durante el trabajo grupal, cuando un/ 
una estudiante explica a la clase cómo resolvió un 
problema, o al examinar un trabajo escrito. Final- 
mente, en la tercera etapa, para que la evaluación 
formativa sea de verdadera ayuda para el aprendi- 
zaje, debe darse una retroalimentación que pro- 
porcione entendimiento acerca de cómo llenar 
una carencia. Por ejemplo, cuando un estudian- 
te tiene aún confusión respecto de un concepto 
fundamental, ¿existe un método diferente para 
abordar el problema o un conocimiento esencial 
al que haya que volver? Si el razonamiento en 
un trabajo de composición está desarrollado en 
forma deficiente, ¿cómo puede corregirlo el es- 
tudiante después de tomar primero en conside- 
ración lo que falta en relación con los criterios de 
evaluación? 

Este modelo de evaluación formativa es más 
que una etapa de recolección de de datos. Es 
un modelo para el aprendizaje que corresponde 
directamente a la Zona de Desarrollo Próximo 
(ZDP) y a la teoría sociocultural del aprendizaje. 
Tal como lo visualizó Vygotsky (1978), la Zona 
de Desarrollo Próximo es la región, en un conti- 
nuo imaginario de aprendizaje, entre lo que un 
niño puede hacer de manera independiente y lo 
que ese mismo niño puede hacer si lo ayudan. 
Wood, Bruner y Ross (1976) desarrollaron ade- 
más la idea del andamiaje 5 para caracterizar el 
apoyo, bajo la modalidad de guía, indicaciones 
y estímulo, que los adultos proporcionan en la 
ZDP con objeto de capacitar a quien aprende 
a desempeñar a un nivel de logro algo que de 
otro modo no habría sido capaz de alcanzar. La 
etapa de evaluación en el modelo de evaluación 
formativa (¿dónde estás ahora?) proporciona la 



s Scaffolding en inglés. Se refiere a la técnica mediante la cual el 
maestro modela la tarea o la estrategia deseada del aprendizaje, y 
luego traslada gradualmente la responsabilidad a los estudiantes. 
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comprensión que se necesita para un respaldo 
eficaz. Y el modelo formativo completo, que 
comprende el esclarecimiento del objetivo y 
la identificación de los medios para llegar ahí, 
puede verse esencialmente como un sinónimo 
del andamiaje de la enseñanza. En realidad, la 
versión plenamente elaborada de Sadler de la 
evaluación formativa requiere que los maestros 
y los estudiantes tengan una comprensión y una 
apropiación compartidas del objetivo de apren- 
dizaje y, por último, que los estudiantes sean 
capaces de supervisar su propio mejoramiento. 
Esto corresponde al objetivo del andamiaje: fo- 
mentar que quien aprende interiorice este pro- 
ceso y asuma su responsabilidad. 

En el mundo real, los maestros rara vez tienen 
tiempo para dar sesiones de tutoría individuales 
o de hacer evaluaciones dinámicas que les per- 
mitieran dedicarse a impartir una enseñanza con 
andamiaje a un estudiante durante un ciclo com- 
pleto de aprendizaje. Y, con seguridad, planear 
la enseñanza para un salón de clases completo 
lleno de estudiantes cuya ZDP es muy variada, 
es un verdadero reto. No obstante, pueden es- 
tablecerse rutinas del aula para garantizar que 
los elementos básicos de la evaluación formativa 
y del andamiaje estén establecidas y funcionan- 
do en la forma de interacciones de enseñanza 
ordinarias. Por ejemplo, hablar con estudiantes 
en forma individual es una parte normal de la 
enseñanza de la escritura, junto con la correc- 
ción editorial por los compañeros o el ejercicio 
de la silla del autor , que es una práctica en la que 
un estudiante comparte algo que ha escrito con 
toda la clase. Otra estrategia es desarrollar las 
capacidades de los estudiantes para proporcio- 
narse retroalimentación unos a otros. Una de las 
razones por las que el discurso sobre el aula ha 
recibido tanta atención en la investigación sobre 
la reforma en la enseñanza, es que las pautas de 
interacción grupal, especialmente las preguntas 
de los estudiantes y la forma en que explican su 
razonamiento, pueden proveer de andamiaje al 
aprendizaje del estudiante, sin que sea necesa- 
rio que el docente invierta tiempo para atender 
a los estudiantes uno por uno. Cobb, Wood, y 



Yackel (1993) hablan de análisis de toda una cla- 
se donde hay andamiaje y donde los estudiantes 
son capaces no sólo de esclarecer su compren- 
sión de conceptos matemáticos, sino también 
de practicar las normas y formas sociales de ha- 
blar en esa disciplina. De igual manera, en clases 
de investigación en Ciencias (Hogan y Pressley, 
1997), los estudiantes aprenden a dar evidencias 
que sustenten una posición y también a criticar 
las conclusiones sin fundamento de sus com- 
pañeros de clase: una forma valiosa de retroali- 
mentación. Semejantes despliegues públicos en 
que se desarrolla el pensamiento crean, asimis- 
mo, la oportunidad perfecta para la evaluación 
formativa. 

Idealmente, pues, la evaluación formati- 
va debe quedar perfectamente integrada en la 
enseñanza. En los párrafos que siguen me ex- 
playo sobre los elementos específicos del pro- 
ceso de evaluación formativa, los cuales tienen 
un extenso fundamento de investigación. Co- 
mienzo ocupándome del contenido porque la 
evaluación carece de significado si no abarca 
las cosas que más queremos que aprendan los 
estudiantes. En seguida considero los avances 
de los estudiantes porque, dentro de los conte- 
nidos de las materias, los maestros deben tener 
también una idea de las progresiones típicas 
de aprendizaje, con el fin de que sepan en qué 
dirección ayudan a los estudiantes, y también 
cómo respaldarlos cuando la comprensión fa- 
lla. Más tarde tomo en cuenta aspectos espe- 
cíficos de las interacciones entre evaluación y 
enseñanza, cómo tener acceso al conocimien- 
to previo, cómo hacer explícitos los criterios, 
proporcionar retroalimentación, etcétera. No 
obstante, no hace falta que ninguno de estos 
procesos interrumpa la enseñanza, sino que 
más bien deben retroalimentar un aprendizaje 
continuo. Aun si uno toma tiempo para un exa- 
men formal, los resultados pueden utilizarse 
para un diagnóstico de la enseñanza con el fin 
de decidir qué conceptos necesitan más análi- 
sis y trabajo. Y los estudiantes pueden llegar a 
entender que tales evaluaciones tienen una fi- 
nalidad de aprendizaje. 
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2.j. La importancia del contenido: selección 
de las tareas de enseñanza y de evaluación 
que encaman objetivos de aprendizaje 

La evaluación no puede impulsar el aprendizaje 
si se basa en tareas o preguntas que distraen la 
atención de los verdaderos objetivos de la ense- 
ñanza. Históricamente, las pruebas tradiciona- 
les a menudo dirigían erradamente la enseñanza 
cuando se centraban en lo que era más fácil de 
medir en vez de centrarse en lo que era impon 
tante aprender. La enseñanza en clase debe ocu- 
par a los estudiantes en actividades de aprendi- 
zaje, las cuales sean lo más directamente posible 
ejemplos de los objetivos reales del aprendizaje. 
Si queremos que los estudiantes sean capaces de 
leer libros, periódicos y poemas, ellos deben en 
realidad hacer eso, por lo que no hay que dan 
les materiales abreviados y simulados, excepto 
cuando queramos adaptarlos a su edad. De igual 
modo, en Ciencias, si queremos que los estu- 
diantes sean capaces de razonar y usar el cono- 
cimiento científico, entonces debemos darles la 
oportunidad de explicarse cómo funcionan las 
cosas, realizando investigaciones y elaborando 
explicaciones con sus propias palabras, para que 
así conecten sus experiencias con las teorías del 
libro de texto. La evaluación, entonces, debe 
realizarse como parte de estas actividades de 
aprendizaje significativo. Si los estudiantes rea- 
lizan un proyecto de investigación en Historia 
o muestran a la clase cómo resolvieron un pro- 
blema de Matemáticas, entonces la tarea de la 
enseñanza es la labor de la evaluación. 

Un rasgo definitorio de las reformas basadas 
en estándares ha sido el desarrollo de normas 
curriculares que sirven para revigorizar y realzar 
qué significa saber y demostrar aprovechamien- 
to en cada disciplina. Por ejemplo, el Curriculum 
and Evaluation Standards for School Mathematics 
del NCTM (1989) 6 plantea expectativas, hace 
hincapié en la solución de problemas, la comu- 
nicación, el razonamiento matemático y el esta- 
blecimiento de conexiones que van mucho más 

6 Siglas en inglés del National Council of Teachers of Mathematics , 
Consejo Nacional de Maestros de Matemáticas. [N. T.} 



allá del dominio de las habilidades y los concep- 
tos básicos. No es de sorprender que la refon 
ma de la evaluación fuera una parte igualmente 
importante de los movimientos de estándares, 
por la necesidad de alcanzar estos objetivos más 
ambiciosos. El término alineación se ha utiliza- 
do para especificar la correspondencia deseada 
entre evaluaciones y estándares curriculares. 
Desafortunadamente, el significado de alinea- 
ción se desvaloriza un tanto cuando los editores 
de pruebas muestran que todos su reactivos de 
selección múltiple pueden hacerse corresponder 
con las categorías de los estándares de conteni- 
do de un estado, aun cuando en conjunto sólo 
utilizan un estrecho subconjunto de los están- 
dares deseados. Anteriormente, he propuesto 
el término encarnar como una forma de carac- 
terizar mejor la alineación más completa y real 
que ocurre cuando las tareas, los problemas y los 
proyectos en los que están ocupados los estu- 
diantes representan toda la gama y profundidad 
de lo que decimos que queremos entiendan y 
tengan capacidad de hacer (Shepard, 2003). 

Tal como lo ilustraron Wiggins y McTighe 
(1998), la elaboración de evaluaciones que mani- 
fiesten objetivos de aprendizaje es esencial para 
una buena enseñanza, y no sólo una cuestión de 
medir resultados. En vez de un planeamiento de 
la enseñanza que se concentre en actividades in- 
teresantes, Wiggins y McTighe utilizan un pro- 
ceso de planificación hacia atrás, que empieza con 
los objetivos de la enseñanza, luego se cuestiona 
¿cuál será una evidencia convincente o una de- 
mostración de que hubo aprendizaje? y al final 
planea actividades que permitirían desarrollar 
en los estudiantes esa comprensión. Con esta 
última como objetivo de la enseñanza, subrayar 
la evaluación fuerza a los maestros a explicar en 
forma muy clara y sin lugar a dudas qué aspecto 
tendría la evidencia de la comprensión, y estas 
descripciones del desempeño los mueven a brin- 
dar oportunidades a los estudiantes para que 
desarrollen y practiquen estas habilidades que 
de otro modo podrían haberse perdido si la com- 
prensión se hubiese dejado sólo como un objetivo 
declarado para toda la unidad. Por ejemplo, un 
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maestro encontraría pruebas de comprensión 
por parte de los estudiantes si éstos pudieran 
explicar su razonamiento o aplicar su conoci- 
miento en un contexto nuevo. Y cada una de 
estas facetas puede desarrollarse aún más para 
dejar en claro qué es lo que los estudiantes se- 
rían capaces de hacer. Por ejemplo, el criterio de 
Wiggins y McTighe (1998) para una explicación 
que demuestre comprensión incluye dar razones 
creíbles, proporcionar una explicación sistemá- 
tica, o utilizar modelos mentales útiles. Si bien 
es cierto que ser capaz de explicar un concepto 
exige mucho más que conocerlo, conocer y ex- 
plicar guardan una estrecha relación entre sí, y 
el razonamiento y pensamiento que además se 
requieren para producir una explicación creíble 
son exactamente el tipo de esfuerzo mental que 
hace falta para desarrollar una comprensión más 
flexible y más profunda. 

2.4. Progresiones del aprendizaje 

Las progresiones del aprendizaje o los continuos 
del aprendizaje son importantes para monitorear 
y respaldar el desarrollo a lo largo del tiempo. A 
diferencia de los estándares, que han recibido 
una gran atención durante la última década, se 
ha desarrollado relativamente poco y ha habi- 
do mucha menos investigación para explicar las 
progresiones en el aprendizaje. Desde luego que 
la mayoría de los maestros tienen cierto senti- 
do intuitivo de qué sigue, o no serían capaces de 
ayudar a los estudiantes a desempeñarse mejor. 
Sin embargo, incluso los maestros más capaci- 
tados podrían sacar provecho de modelos con 
mayor desarrollo formal sobre cómo se desplie- 
ga el aprendizaje en un ámbito curricular, y se 
beneficiarían también si conocieran las variacio- 
nes y desviaciones naturales del patrón típico. Si 
bien las progresiones empíricamente validadas 
pueden hacer posible un andamiaje más com- 
prensivo de la enseñanza, las progresiones jamás 
deben interpretarse como algo cerrado o como 
una secuencia absoluta de requisitos. 

El mapa de progreso en escritura que aparece 
en la Figura 17.1, del Australia’s National School 



English Literacy Survey, el cual ejemplifica una 
progresión en el aprendizaje, fue diseñado para 
reunir datos básicos sobre la realización y los lo- 
gros de estudiantes del tercer y quinto grados en 
el curso de Lengua, incluyendo Habilidades de 
lectura, Revisión visual, Audición y Expresión 
oral y escrita (Masters y Forster, 1997). El pro- 
greso de un estudiante en conseguir el control 
de estructuras y convenciones del lenguaje pue- 
de diagramarse o comunicarse en este continuum, 
el cual proporciona una imagen del crecimiento 
individual en contraposición con un telón de 
fondo de expectativas establecidas normativa- 
mente. A diferencia de los informes de evalua- 
ción, que se ven más bien como una lista de ve- 
rificación de objetivos de los diferentes grados, 
los mapas de progreso tienen implicaciones más 
directas para la enseñanza, porque brindan si- 
multáneamente una imagen de las fortalezas y 
debilidades y una manera de mirar hacia lo que 
viene para cada una de las facetas del campo de 
que se trate. Por ejemplo, un estudiante de se- 
gundo grado puede estar muy avanzado en el uso 
de la puntuación (mayúsculas y puntos) y dele- 
trear palabras comunes correctamente (Nivel 3), 
pero tal vez necesite ayuda para experimentar e 
ir más allá de estructuras repetitivas de oracio- 
nes (Nivel 2). 

En Australia, los sistemas de evaluación son 
coherentes con las evaluaciones en el aula y en 
gran escala están relativamente bien desarrolla- 
dos y vinculados a un mismo mapa de progreso 
(Forster y Masters, 2004). Algo parecido sucede 
en los Países Bajos, donde se elaboran trayecto- 
rias aprendizaje-enseñanza para proporcionar los 
conocimientos pedagógicos necesarios para 
respaldar el desarrollo del pensamiento del es- 
tudiante a lo largo del tiempo (Van der Heuvel- 
Panhuizen, 2001). En Estados Unidos, en cam- 
bio, el desarrollo de progresiones de aprendizaje 
útiles para la enseñanza se ha visto limitado por 
la forma transversal y a retazos, que con el tiem- 
po han propiciado los sistemas de evaluación en 
gran escala. Las evaluaciones estatales y nacio- 
nales, que originalmente se propusieron moni- 
torear tendencias en momentos particulares, 
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centraron la atención en las expectativas del ni- 
vel a alcanzar en ciertos grados fundamentales 
(cuarto año de primaria, segundo de secundaria 
y tercero de preparatoria). En años más recien- 
tes, los estados, que ahora piden más requisitos 
para las pruebas individuales, completan los gra- 
dos intermedios e intercalan las expectativas cu- 
rriculares. No obstante, estas expectativas, es- 
pecialmente en momentos en que los estándares 
de nivel internacional se han establecido en currí- 
culos que nunca se habían implementado antes, 
no necesariamente reflejan la trayectoria del de- 
sarrollo de estudiantes reales. Al mismo tiempo, 
existe el peligro de que depender de promedios 
normativos para establecer progresiones, con- 
gelará las expectativas curriculares pasadas de 
moda o establecerá expectativas demasiado ba- 
jas -porque promedian los resultados de una en- 
señanza fallida. Por ejemplo, con base en datos 
empíricos, la Keymath Diagnostic Arithmetic Test 
(Connolly, Nachtman, y Pritchett, 1972) utiliza 
reactivos en la forma de 41/2x5 como ejemplo 
de la Aritmética que, se espera, deben dominar 
los estudiantes en el grado equivalente al tercero 
de secundaria. 

Lo que hace falta es un proceso para crear 
continuos de aprendizaje que estén basados no 
sólo en la investigación, sino en un juicio ex- 
perto que incluya la validación de los continuos 
propuestos en el contexto de un currículo bien 
implementado. Hasta la fecha, algunas de las in- 
vestigaciones más fundamentadas y más perti- 
nentes respecto de la enseñanza, se han hecho 
en las áreas del alfabetismo emergente y de la 
habiHdad con los números también emergen- 
te, las cuales pueden servir como modelo. Por 
ejemplo, en la ortografía prefonémica, los niños 
escriben primero letras que representan pala- 
bras sin relacionar los sonidos de las letras con 
la palabra deseada. Después dan un paso en su 
desarrollo cuando empiezan a escribir letras que 
tienen correspondencia con los fonemas más 
prominentes en una palabra, y así sucesivamente 
(Hiebert y Raphael, 1998). De modo parecido, 
las estrategias naturales de los niños para sumar 
se desarrollan con el tiempo, desde que empie- 



FIGURA 17.1 Mapa de progreso en escritura 
fundamentado empíricamente 
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Revisa escritura para que sea consistente en conte- 
nido y estilo. 

Hace pruebas con distintos reordenamientos de ora- 
ciones. 

Controla estructuras gramaticales y puntuación en , 
oraciones complejas. 

Organiza la escritura en un todo coherente apropiado ^ 
600 — f- al contexto (por ejemplo: párrafos para textos narrati- 
vos y subtítulos para textos informativos). 

Utiliza vocabulario preciso y eficaz. 

Se acerca a la ortografía de palabras particularmente 
difíciles utilizando modelos y convenciones. 



Empieza a adoptar convenciones de formato estruc- 
turado para organizar su trabajo (por ejemplo: una ex- 
posición introductoria general a un informe). 

Maneja una diversidad de formas de oraciones (por 
5°° — [ ejemplo: oraciones sencillas y complejas). 

Utiliza puntuación apropiada la mayor parte del tiempo. 
Da cuerpo a su escritura con un inicio y un final cla- 
ros, y posiblemente divide los párrafos. 

Utiliza vocabulario apropiado la mayor parte del 
tiempo. 

Escribe correctamente la mayor parte de las pala- 
bras. 



Muestra algunas evidencias de cierta planeación, revi- 
sión y corrección de su propia escritura. 

Controla la estructura de oraciones sencillas e intenta 
utilizar estructuras más complejas. 

Intenta variar inicios de oración. ^ 

Intenta dar forma a su escrito en lo referente a la es- Z 
tructura (por ejemplo: idea del principio y el fin). 

Escribe correctamente muchas de las palabras comu- 
nes. 

Escribe legiblemente. 



Usa oraciones sencillas. 

Usa una estructura repetitiva de oración. 

Utiliza conjunciones sencillas (por ejemplo, “y” 
“pero”). 

Controla la puntuación común a menudo o todo el 
tiempo (por ejemplo, mayúsculas y puntos). 

Escribe correctamente casi todo el tiempo palabras 
muy frecuentes. 

Escribe de un modo que otros pueden por lo general 
entender. 



.Utiliza algunas convenciones básicas (por ejemplo, 
escribe de izquierda a derecha y pone espacios entre 
las palabras). 

Maneja algunas palabras conocidas, o palabras repre- ¡> 
sentadas por sus letras iniciales. ^ 

Utiliza algunas letras iniciales correctas y otros sonidos. 

El niño puede volver a leer lo que ha escrito mientras 
lo está escribiendo 



Fuente: De Masters, G. y Forster, M. (1997), MappingLitera- 
cy Achievement: Results of the 1996 National School English Lit~ 
eracy Survey, Canberra, Australia, Department of Employ- 
ment, Education, Training and Yourh Affairs (DEETYA). 
Reproducido con permiso. 
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